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Abstract of DE19710252 

The processing system 11 has a number of parallel processors 12. Instruction routine execution data is 
collected 13 and used to generate a processing profile in the form of a series of reports. This allows the 
various routines to be classified. The execution time data is summed 14 and a statistical evaluation made. 
A graphical representation is made that shows maximum, minimum, average and standard variation of the 
execution times of the routines. 
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Prufungsantrag gem. § 44 PatG ist gestellt 

@ Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungsuberwachung und -Analyse in einem 
Parallel rechnersystem 

(g) Es wird ein Verfahren der sichtbaren Darstellung von 
Ergebnissen der Leistungsuberwachung und -analyse fur ein 
Parallelrechnersystem beschrieben, bei dem eine Vieizahl 
von Prozessoren ein parallel verarbeitendes Programm aus- 
YGhren, welches aus einer Vieizahl von Routinen zusammen- 
gesetzt ist. Zuerst werden Informationen hinsichtlich der 
Ausfuhrungszeit von jeder Routine in einer Realzeitweise 
gesammelt, wahrend das Programm gleichlaufend durch die 
Vieizahl von Prozessoren ausgefuhrt wird. Zweitens werden 
Maximal-, Mittel- und Minimalwerte der Ausfuhrungszeit 
von jeder Routine berechnet, basierend auf den Informatio- 
nen, die fur die Vieizahl der Prozessoren gesammelt wurden. 
_ Drittens werden die gesammelten Informationen in Form 
eines Ausfuhrungsprofils zusammengefaSt oder summiert 
J und werden in graphischer Form dargestellt, und zwar unter 
Verwendung von Balkengraphiken, Kreisgraphiken oder Ra- 
darkarten. Fur jede Prozedur oder Programmschleife klassifi- 
ziert das vorliegende Verfahren die Prozentsatze der An wen - 
der-Netto-Programmausfuhrung, Kommunikation, Synchro- 
nisation und anderer parallel laufender Zusatzaufgaben, und 
zeigt auch deren Abweichungen an. Dieses Merkmal unter- 
stutzt den Anwender darin, das aktuelle Programmverhalten 
zu verstehen und das parallel verarbeitende Programm 
abzustimmen. 
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Beschreibung 



HINTERGRUND DER ERFINDUNG 
1. Gebiet der Erfindung 

Die vorliegende Erfindung betrifft ein Verfahren zur sichtbarcn Darstellung von Ergebnissen der Leistungs- 
uberwachung und -analyse in einem Parallelrechnersystem, welches eine Vielzahl von Prozessoren verwendet, 
und betrifft spezieiler ein Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungsuberwachung und 
•analyse in einer bedienungskomfortableren und umfassenden Weise. Die vorliegende Erfindung betrifft auch 
ein computer-lesbares Medium, welches mit einem Computerprogramra codiert ist, bei welchem das zuvor 
genannte Verfahren realisiert wird 

2. Beschreibung des verwandten Starides der Technik 

Parallele Verarbeitungstechniken spielen eine entscheidende Rolle bei der Befriedigung von heutzutage 
wachsenden Anf orderungen nach Hochleistungsrechnersysteraen. Ein Parallelrechnersystem fuhrt eine Anwen- 
dung aus, indem es eine Vielzahl von Prozessoren verwendet, die parallel laufen, wodurch ein hoher Verarbei- 
tungsdurchgang erzielt wird Die Entwicklung von Software fur ein Parallelrechnersystem bringt jedoch im 
allgeraeinen einige Schwierigkeiten bei der Programmaustestung, Bewertung und Leistungsabstimmung mit 
sich, und zwar auf grund deren komplexer Natur. 

Urn das Problem zu losen, werden Leistungsanalysierer als ein gunstiges Werkzeug eingefQhrt, welches die 
Software-Programmierer darin unterstutzt, das Verhalten eines Parallelprogramms beimTesten zu uberwachen 
und dessen Leistung zu raessen, Der Analysierer verarbeitet die gesammelten Daten und prasentiert das 
Ergebnis dem Anwender in Form eines aufsummierten Ausfuhrungsprofils 

Ein herkommlicher Leistungsanalysierer erzeugt ein Ausfuhrungsprofil von einzelnen Prozessoren, welches in 
solcher Weise aufsummiert ist daB die gesamte Verarbeitungszeit in einige Kategorien klassifiziert ist, enthal- 
tend Netto-Betriebszeit und Leeriaufzeit usw. Das Ausfuhrungsprofil jedes Prozessors wird getrennt in Form 
einer Balkengraphikoder ahnlichem dargestellt 

Dieses herkoramhche Verfahren der Darstellung von Ausfuhrungsprofilen ist jedoch fur Software-Entwick- 
lungsingenieure in keiner Weise vorteilhaft, wenn das Parallelverarbeitungssystem hunderte von Prozessoren 
enthalt Die an einem Analysierer-Bildschirm dargestellten Informationen sind zu umfangreich, urn das Pro- 
grammverhalten richtig verstehen zu konnen, da zu viele Prozessoren parallel laufen. In einem solchen Fall kann 
der herkommliche Analysierer die Schwierigkeit dadurch etwas mildern, indem eine gewisse statistische Verar- 
beitung hinsichtlich der gewonnen Rohdaten angewandt wird Dies erlaubt es, das Gesamtprogrammverhalten 
oder die mittlere Leistung der Prozessoren den Ingenieuren in einer verstandlicheren Art darzubieten. 

Jedoch sind die Informationen, die durch diesen herkommlichen Leistungsanalysierer vorgesehen werden, fur 
die Software-Entwicklungsingenieure nicht ausreichend, urn die Systemqualhat bzw. Leistung vollstandig ver- 
stehen zu kdnnen und die detaillierte Beziehung zwischen den Prozessen verstehen zu konnea die parallel 
laufen. 

ZUSAMMENFASSUNG DER ERFINDUNG 

Unter Einbeziehung des oben gesagten, besteht eine erste Aufgabe der vorliegenden Erfindung darin, em 
verbessertes Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungsuberwachung und -analyse in 
einem Parallelrechnersystem zu schaffen, welches Prozentsitze der Anwender-NettcnProgrammausfuhning, 
Kommunikation, Synchronisation und anderer parallel ablauf ender Organisationsaufgaben zeigt als auch deren 
Abweichungen anzeigt 

Es ist ein weiteres Ziel der vorliegenden Erfindung, ein verbessertes Verfahren zur sichtbaren Darstellung von 
Ergebnissen der Leistungsuberwachung und -analyse in einem Parallelrechnersystem zu schaffen, welches dem 
Anwender die Moglichkeit bietet, Software-Routinen in einem parallel verarbeitenden Programm zu bewerten, 
und zwar uber eine problemlose und vorteilhafte graphische Wiedergabe des Ausfuhrungsprofils. 

Um die genannte Aufgabe zu losen, schafft die vorliegende Erfindung ein Verfahren zur sichtbaren Darstel- 
lung von Ergebnissen der Leistungsuberwachung und -analyse in einem Parallelrechnersystem, bei dem eine 
Vielzahl von Prozessoren ein paralieles Verarbeitungsprogramm ausfuhren, welches aus einer Vielzahl von 
Routinen zusammengesetzt ist Das Verfahren umf aBt die folgenden Schritte: 

(a) Sammeln von Informationen hinsichtlich der Ausfuhrungszeit von jeder Routine, die gleichlaufend durch 
eine Vielzahl von Prozessoren ausgefuhrt wird unter BerQcksichtigung der KJassifizierung der Routinen; 

(b) Ableiten eines Maxim alwertes, eines Mittelwertes, eines Minimahvertes und einer Standardabweichung 
der Ausfuhrungszeit von jeder Routine basierend auf den Informationen, die fur die Vielzahl der Prozesso- 
ren gesammelt wurden; und 

(c) graphisches Darstellen der Ausfuhrungsprofil-Information, welche den Maximalwert, deh Mittelwert 
und den Minimalwert und die Standardabweichung der Ausfuhrungszeit jeder Routine enthalt 

Um speziell das weitere Ziel welches oben erlautert wurde, zu erreichen. wird ein Verfahren zur sichtbaren 
Darstellung von Ergebnissen der Leistungsuberwachung und -analyse fur ein Parallelrechnersystem geschaffen. 



GeraaB dem Verfahren werdea AusfuhruiigsprofiMnYorraationen in Form von Balkengraphiken, Kreisgraphi- 
ken oder Radarkarten dargestellt 

Weitere Ziele neben den obigen, MerkmaJe und Vorteile der vorBegenden Erfindung ergeben sich aus der 
folgenden Beschreibung in Verbindung mit den beigefQgten Zeichnungen, die eine bevorzugte Ausfuhningsform 
der vorliegenden Erfindung als Beispiel veranschaulichen. 

KURZBESCHREIBUNG DER ZEICHNUNGEN 

Fig. 1 ist eine KonzeptdarsteUung eines Leistungsanalysierersystems, welches ein Sichtdarstellungsverfahren 
gemaB der vorliegenden Erfindung verwendet; 

Fig. 2 ist ein FluBdiagramm, welches einen ProzeB der Modifizierang und Kornpilierung eines Prograraras 
zeigt, welches fur ein Parallelverarbeitungssystem geschrieben wurde; 

Fig. 3 ist eine Tabelle, in der Laufzeit-Subroutinen aufsummiert sind, die fQr eine Leistungsuberwachung und 
-analyse vorgesehen werden; 

Fig. 4 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine 4* 1 beschreibt; 

Fig. 5 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 2 beschreibt; 

Fig. 6 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 3 beschreibt; 

Fig. 7 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 4 beschreibt; 

Fig. 8 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 5 beschreibt; 

Fig. 9 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 6 beschreibt; 

Fig. 10 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine tt 7 beschreibt; 

Fig. 11 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine #8 beschreibt; 

Fig. 12 ist eine Tabelle, in der die Informationen aufsummiert sind, die durch das Leistungsanalysierersystem 
der vorliegenden Erfindung zu sammeln sind; 

Fig. 13 ist ein Diagramm, welches ein erstes Beispiel einer Ausfuhrungsprofilanzeige geraaB der vorliegenden 
Erfindung zeigt, bei der jede Prozedur oder Schleif e skaJiert ist in bezug auf die AusfOhrungszeit ernes gesamten 
Programms; 

Fig. 14 ist ein Diagramm, welches ein zweites Beispiel der Ausfuhrungsprofildarstellung zeigt bei der alle 
Prozeduren und Schleifen in gleicher Weise skaliert sind, ungeachtet deren absoluter Ausfuhrungszeiten; 

Fig. 15 ist ein Diagramm, welches ein drittes Beispiel einer Ausfuhrungsprofildarstellung zeigt, in der das 
Ausf uhrungsprofil von jeder Prozedur oder Schieife in einer Kxeisgraphik wiedergegeben ist; 

Fig. 16 ist ein Diagramm, welches ein viertes Beispiel der Ausfuhrungsprofildarstellung zeigt, in der das 
Ausfuhrungsprofil in einer Radarkarte wiedergegeben ist; 

Fig. 17 ist ein Diagramm, welches ein funftes Beispiel einer Ausfuhrungsprofildarstellung gemaB der vorlie- 
genden Erfindung zeigt; und 

Fig. 18 ist ein Diagramm, welches ein sechstes Beispiel der Ausfuhrungsprofildarstellung geraaB der vorlie- 
genden Erfindung zeigt. 

BESCHREIBUNG DER BEVORZUGTEN AUS FOHRUNGS FORM 

Eine Ausfuhrungsform der vorliegenden Erfindung soli nun ira folgenden unter Hinweis auf die beigefugten 
Zeichnungen beschrieben werdea 

Fig. 1 ist eine Konzeptdarstellung eines Leistungsanalysierersystems, in welchem ein Sichtbardarstellverf ah- 
ren gemaB der vorliegenden Erfindung angewandt wird. Ein Parallelrechnersystem 1 1 ist durch eine Vielzahl von 
Prozessoren 12a— t2n aufgebaut, die als Berechnungselemente dienen und die zusamraen laufen, urn umf angrei- 
che Berechnungsaufgaben zu erzielen, die in einera Parallelverarbeitungsprogramm codiert sind. Sokhe Prozes- 
soren 12a— 12n umfassen einzeln Datensammeleinrichtungen 13a— 13n und eine Datensummiereinrichtung 
14a- 14n zum Korrigieren und Aufsummieren von jeweils Ausfdhrungszeitdaten. 

Die Datensammeleinrichtungen 13a— 13n sammeln in einer Real zeitweise die Ausfuhrungszeitdaten wahrend 
der Pro^animausnlhrung in den jeweiligen Prozessoren 12a— 12n, in denen sie auftreten. Die Ausfuhrungszeit- 
daten, die durch die Datensammeleinrichtungen 13a— 13n gesammelt wurden, werden als Quellendaten fQr die 
Ausfuhrungsprofile verwendet Die Ausfuhrongsprofile bestehen aus einem Satz von Reports, welche die 
Anwender mit Informationen fiber die Prozessoren 12a— 12n, daB diese tats§chlich arbeiten, versehen, wodurch 
diese das Programm von verschiedenen Gesichtspunkten aus bewerten konnen. 

Die Ausfuhrungsprofile weisen auf einige bestiramte Programmroutinen hin, welche das Parallelverarbei- 
tungsprogramm bilden, wie beispielsweise Prozeduren, Schleifen, eine parallele Verarbeitungsbibliothek, die 
durch das Leistungsanalysierersystem uberwacht und analysiert werden. In diesem Sinn werden diese Routinen 
als Subjekte der Profilbildung oder Profilsubjekte bezeichnet 

Die Datensummiereinrichtungen 14a— 14n summieren die Ausfuhrungszeitdaten, die durch die Datensammel- 
einrichtungen 13a- 13n gesammelt wurden. Spezifisch gesagt, berechnen sie Maximal-, Mittel-, Miniraalwerte 
und eine Standardabweichung der gesammelten Ausfuhrungszeiten fflr jede Routine oder jedes Subjekt fOr die 
Profilbildung. Urn diese Aufgabe zu erreichen, ist es erforderiich, alle Ausfuhrungszeitdaten zu kompilieren, die 
durch die Datensammeleinrichtungen 13a- 13n an einer einzelnen Stelle gesammelt wurden Daher befaBt sich 
eine der Datensummiereinrichtungen, wie beispielsweise 14^, mit den Summierungsaufgaben und andere 
14b - 14n senden einfach ihre Daten zu dieser Datensummier-Subroutine 14a unter Verwendung von Inter-Pro- 
zessor-Komraunikationspfaden (nicht gezeigt) in dem Parallelrechnersystem 1 1. 

In Wirklichkeit sind die oben beschriebenen Datensammeleinrichtungen 13a— 13n und die Datensummierein- 
richtungen 14a- 14n in dem Parallelrechnersystem 11 in Form eines Satzes von Subroutinen implementiert, die 



als cin Teil der Laufzeitbibliothek fur die Parallelverarbeitung vorgesehen sind. Bei der vorliegenden Ausfuh- 
rungsform stehen acht Laufzeit-Subroutinen fur diesen Zweck zur Verfugung, wie in Fig. 3 aufgefistet ist Die 
detaillierten Funktionen der Datensammeleinrichtungen 13a— 13n und der Datensummiereinrichtungen 
14a — 14n sollen ge trennt unter Hinweis auf die Fig. 4 bis 1 1 beschrieben werden. 

Um erneut auf Fig. 1 einzugehen, ist das Parallelrechnersystera 11 an zwei Datendateien gekoppeit: eine 
Quellencodedatei 15 und eine Profilinformationsdatei 16. Die Quellencodedatei 15 enthait den originalen Quel- 
iencode eines Programms, welches durch die Prozessoren 12a— 12n ausgefQhrt werden sol Die Profilinforma- 
tionsdatei 16 speichert Ausfuhrungszeitdaten und deren Summendaten, wie sie von den Prozessoren 12a— 12n 
bendtigt werden. 

Ein Profilanzeigeprozessor 17 analysiert die Inhalte der Profilinformationsdatei 16 und stellt das Ergebnis 
dieser Analyse in einem Ausfuhrungsprofilfenster 22 auf einera Bildschirm einer Anzeigeeinheit 21 dar. Hier 
macht der Profilanzeigeprozessor 17 das Ergebnis der Analyse sichtbar, und zwar unter Verwendung raehrerer 
graphischer Wiedergabetechniken, wie dies an spaterer Stelle in Verbindung mit den Fig. 13 bis 18 beschrieben 
werden solL Eine Eingabevorrichtung 18 wird dazu verwendet, um einige Befehle oder Daten in den Profilanzei- 
geprozessor 17 einzugeben. 

Bei Verwendung dieser Eingabevorrichtung 18 kann der Anwender dieses Leistungsanalysierersystems einen 
spezifischen Punkt (z. B. eine Prozedur oder Schleife) bezeichnen, der in dem Ausfuhrungsprofilfenster 22 
dargestellt wird. Ein Quellencode-Positionsanalysierer 19 sucht nach dem Quellencode, um die Codeposition 
(oder Zeilenzahl) entsprechend dem Punlct herauszufinden, der durch den Anwender bezeichnet worden ist 
Gemafi der Codeposition-lnformation, die durch den Quellencode-Positionsanalysierer 19 geliefert wird, extra- 
hiert einen Quellencode-Browser 20 den relevanten Teil des Quellencodes 15 und zeigt den extrahierten 
Quellencode in einem Quellencodefenster 23 auf dem Bildschrift der Anzeigeeinheit 21 an. 

Bevor die Programmausftthrung bei dem oben beschriebenen System gestartet wird, ist es erforderlich, den 
originalen Quellencode in ein ausfuhrbares Programm zu ubersetzen oder zu kompilieren. Bei der vorliegenden 
Erfindung sollte der Quellencode vor der Kompilierung modifiziert werden, und zwar fur Oberwachungs- und 
MeBzwecke. Spezifischer gesagt schiebt das KLorapiliersystem Subroutine-Ruf-Zustande in den Quellencode ein, 
um einige Laufzeit-Subroutinen fur die Datensamralung und Summierung an geeigneten Punkten in dem 
Programm aufzurufen. 

Der Quellencode eines parallel verarbehenden Programms besitzt eine hierarchische Struktur. Das Pro- 
gramm oder die Anwender- Anwendung besteht aus einer Vielzahl von Prozeduren. Eine Prozedur ruft einige 
andere Prozeduren auf; mit anderen Worten kdnnen Prozeduren verschachtelt werden. Als Tatsache ist der 
Hauptkdrper des Programms eine Prozedur, die implizit als "MAIN" bezeichnet wird, die mehrere Abkdram- 
lingsprozeduren enthait Die Schleife besteht aus einer Sequenz von Befehlen als Teil einer Prozedur, die iterativ 
ausgefQhrt werden. 

Um die paralle Programmausfuhrung zu unterstutzen, sieht das System eine Bibliothek von Routinen vor, um 
eine ProzeBkommunikation, Synchronisation und andere Aufgaben auszufuhren, die bei der parallelen Verarbei- 
tung inharent vorkommen. Diese werden als parallel verarbeitende Bibliotheksroutinen bezeichnet, welche 
durch die Prozeduren nach Bedarf aufgerufen werden. Da sie die Systemleistung als parallel laufende Zusatze 
beeinflussen, sind die parallel verarbeitenden Bibliotheksroutinen ein wichtiges Merkmal bei der Ausf uhrung der 
Profilbildung. 

Fig. 2 zeigt ein FluBdiagramm, welches einen ProzeB der Modifizierung und Kompilierung eines Programms 
fur das Parallelrechnersystera 1 1 zeigt Dieser ProzeB enthait die folgenden sieben Schritte. 

[SI] Es wird der Quellencode eines parallel verarbeitenden Programms, welches in jedem Prozessor in dem 
Parallelrechnersystera 11 auszufuhren ist, in das Kompilierungssystem eingegeben. 

[S2] Es wird eine Feststellung zum Aufrufen einer Laufzeit-Subroutine # 1 in den Anfangsteil des Hauptpro- 
grammkorpers eingef ugt Die Laufzeit-Subroutine # 1 zeichnet die Zeit auf, wenn das Programm gestartet wird 

[S3] Es werden Feststellungen zura Aufrufen der Laufzeit-Subroutinen #2 und #3 jeweils in den Anfangsteil 
und in den Endteil jeder Prozedur eingef iigt, die in dem Quellencode enthalten ist 

[S4] Es werden Feststellungen zum Aufrufen der Laufzeit-Subroutinen #4 und #5 jeweils in den Anfangsteil 
und in den Endteil jeder Schleife eingefugt, die in den Prozeduren enthalten ist 

[S5] Es werden Feststellungen zum Aufrufen der Laufzeit-Subroutinen # 6 und #7 jeweils in den Anfangsteil 
und in den Endteil jeder parallel verarbeitenden Bibliotheksroutine eingefugt 

[S6] Es wird eine Feststellung zum Aufrufen der Laufzeit-Subroutine #8 in den Endteil des Hauptprogramra- 
korpers eingefugt 

[S7] Das Kompilierungssystem ubersetzt (oder korapiliert) die Quellencodedatei 15, die nun die bei den 
Schritten S2 bis S6 eingefOgten Subroutme-Aiifruf-FeststeUungen enthait, in den Objektcode, der durch die 
Prozessoren 12a— 12n ausfuhrbar ist 

Durch Ausfuhren der oben eriauterten Schritte SI bis S7 fQgt das Kompilierungssystem einige geeignete 
Feststellungen in die Quellencodedatei 15 ein, um die Laufzeit-Subroutinen fur die Datensammlung und Auf sum- 
mierung aufzurufen und es kompiliert die Quellencodedatei 15, um den ausfuhrbaren Objektcode zu generieren. 
Als ein Ergebnis enthait der generierte Objektcode Subroutine - Auf ruf- Befehle sowohl an den Start- als auch 
Endpunkten des Hauptprogrammkorpers, der Prozeduren, Schieifen und der parallel verarbeitenden Bibliot- 
heksroutinen. 

Fig. 3 faBt die Laufzeit-Subroutinen, die zum Zweck der Leistungsuberwachung und -analyse eingefQhrt 
wurden, zusammen. Die Tabelle 30 beschreibt kurz die Funktionen der acht Laufzeit-Subroutinen in deren 
jeweiligen Gelegenheiten, bei denen sie aufgerufen werden. 

Die in dieser Tabelle aufgelisteten ersten sieben Subroutinen (# 1 bis #7) sind Subroutine^ die zum Sammeln 
von Zeitwertzeichendaten und zum Akkumulieren der AusfQhrungszeit von jedera Abschnitt des Parallelpro- 
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gramms ausgelegt sind Das heiBt, solche Subroutinen #1 — #7 entsprechend dcr Datensararaeleinrichtung 
13a- 13n in Fig. 1. Die achte Subroutine #8 besteht aus einer Subroutine, die zura Summieren der Daten 
ausgelegt ist,die durch die Subroutinen #1 bis #7 gesammelt und akkumuliert wurden. Die Subroutine #8 
entspricht sorait der Datensuraraiereinrichtung 14a— 14n. 

Una auf die Fig. 4 bis 11 etnzugehen, so das folgende hinsichtlich der detaillierten Funktionen der Laufzeit- $ 
Subroutinen # 1 - # 8 erlautert, die in den Quellencode eingefQgt sind 

Fig. 4 zeigt ein FluBdiagramm, welches die Laufzeit-Subroutine # 1 zeigt, die dann aufgerufen wird wenn das 
Prograram startet zu laufen und die zwei folgenden Aufgaben vorsieht 

[Sll a] Initialisieren eines ortlichen Datenbereiches, der zura Aufzeichnen und zum Analysieren des Prozessor- 
Verhaltens verwendet wird to 

[Si 1 b] Aufzeichnen des Programmstartzehpunktes. 

Die Fig. 5 und 6 sind FluBdiagramme, welche die Laufzeit-Subroutinen #2 bzw. #3 zeigen. Die Laufzeit-Sub- 
routine #2 wird zu Beginn von jeder Prozedur aufgerufen und wie bei dem Schritt S12a von Fig. 5 gezeigt ist, 
zeichnet sie den Ausfuhrungsstartzeitpunkt dieser Prozedur auf. Als ein Gegenstuck zu dieser Subroutine #2 
wird die Laufzeit-Subroutine #3 aufgerufen, wenn die Prozedur beendet wird und sie fuhrt die folgenden drei 15 
Aufgaben aus: 

[S13a] ErhaJten der AusfOhrungs-Ende-Zeit der Prozedur. 

[S13b] Akkumulieren der Ausfuhrungszeit der Prozedur (das heiBt Akkumulieren der Differenz zwischen der 
Ausfuhrungsstartzeit und der Ausfuhrungs-Ende-Zeit); 

[Sl3c] Akkumulieren der AusfOhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die durch die 20 
Prozedur aufgerufen wurde (das heiBt Akkumulieren der Differenz zwischen der Ausfuhrungsstartzeit und der 
Ausfuhrung-Ende-Zeit, die durch die Laufzeit-Subroutinen #6 und #7 fur jede parallel verarbeitende Bibliot- 
heksroutine auf gezeichnet wurde). 

Fig. 7 zeigt ein FluBdiagramm der Laufzeit-Subroutine #4, welche aufgerufen wird wenn der Prozessor in 
eine Schleife eintritt Die Schleife umfafit eine Foige von Befehlen, die iterativ ausgefuhrt werden, und zwar 25 
unter der Steuerung einer Schleifen-Zahler- Variablen. Jedesrnal, wenn die Schleife ausgefiihrt wird, wird die 
SchJeif en-Zahler- Variable erhdht (oder vermindert), und zwar urn ein vorbestimmtes Inkrement und es wird die 
Schleife wiederholt, bis die Schleifen-Zahler- Variable einen vorgeschriebenen Grenzwert erreicht oder andere 
Beendigungsbedingungen erfullt sind Urn statistische AusfQhrungsdatea fflr die Schleif en zu samraeln, fuhrt die 
Laufzeit-Subroutine # 4 die folgenden zwei Aufgaben durch: 30 
[S14a] Aufzeichnen der Ausfuhrungsstartzeit der Schleife. 

[S14b] Erhalten des Anfangswertes der Schleifen-Zahler- Variablen und des Inkrements (oder Schleifenzahler- 
SchrittgroBe) fur jede Iteration, und Aufbewahren derselben fur zukunftige Verwendung. 

Fig. 8 zeigt ein FluBdiagramm der Laufzeit-Subroutine #5, die ausgefuhrt wird, wenn eine Schleife beendet 
wird Diese fullt die folgenden vier Aufgaben far jede Schleife. 35 
[S15a] Erhalten der Ausfuhrung-Ende-Zeit der Schleife. 

[S15b] Akkumulieren der Ausfuhrungszeit der Schleife (das heiBt Akkumulieren der Differenz zwischen der 
Ausfuhrungsstartzeit und der Ausfuhrung-Ende-Zeit f Or die Schleife). 

[Sl5c] Erhalten des endgultigen Wertes der Schleifensteuer-Variablen und Berechnen der Zahl der Iterationen 
basierend auf den Anfangs- und Endwerten der Schleifen-Zahler- Variablen und der SchrittgrdBe, 40 
[Sl5dl Akkumulieren der Zahl der Iterationen. 

[S15e] Akkumulieren der Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die durch die 
Schleife aufgerufen wird Hier wird die Ausfuhrungszeit dadurch erhalten, indem die Ausfuhrungsstartzeit bzw. 
Ausfuhrungsstartzeitpunkt von dem Ausfuhrung-Ende-Zehpunkt subtrahiert wird die durch die Laufzeit-Sub- 
routinen #6 und #7 fur jede parallel verarbeitende Bibliotheksroutine auf gezeichnet wurden, die von der 45 
Schleife aufgerufen wurden. 

Die Fig. 9 und 10 zeigen die Laufzeit-Subroutinen #6 und #7, die aufgerufen werden, wenn eine parallel 
verarbeitende Bibliotheksroutine jeweils startet und endet Das heiBt, die Laufzeit-Subroutine #6 fuhrt den 
folgenden Schritt aus: 

[S 1 6a] Aufzeichnen des A usf uhrungsst artzei tpunktes der parallel verarbeitenden Bibliotheksroutine. so 

Als Gegenstuck zu dieser Laufzeit-Subroutine #6 erzeugt die Laufzeit-Subroutine #7 folgendes: 
[S 17a] Erhalten des Ausfuhmngs-Ende-Zeitpunktes der parallel verarbeitenden Bibliotheksroutine. 
[S17b] Akkumulieren der Ausfuhrungszeit der parallel verarbeitenden Bibliotheksroutine, wobei die Ausfuh- 
rungszeit die Differenz zwischen dem Ausfuhrungsstartzeitpunkt, der bei dem Schritt S16a aufgezeichnet wurde, 
und dem Ausfuhrung-Ende-Zeitpunkt, der bei dem Schritt SI 7a erhalten wurde, ist 55 

Fig. 11 zeigt ein FluBdiagramm, welches die Laufzeit-Subroutine #8 wiedergibt, die am Ende des gesamten 
Programms ausgefuhrt wird Die Laufzeit-Subroutine #8 summiert die Ausfuixrungszeitdaten auf, die durch die 
anderen Laufzeit-Subroutinen #1 bis # 7 gesammelt wurden, und zwar getnaB den folgenden Schritten: 
[SI 8a] Berechnen der mittleren angesammelt Zeit von jeder parallel verarbeitenden Bibliotheksroutine, die 
durch jede Prozedur aufgerufen wurde, gemaB den folgenden Gleichungen: 60 



Tcp(avg) = Tcp(m) ..-(I) 

n 

Twp(avg) = ±£ Twp(m) -..(2) 
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Top(avg) = Top(m) ..-(3) 

worin n eine ganze Zahl ist, weiche die Anzahl der Prozcssorcn wiedergibt, die in dem Parallelrechnersystera 11 
involviert sind und m eine ganze Zahl ist. die von i bis n reicht und dazu verwendet wird, urn einen spezifischen 
Prozessor anzuzeigert Tcp(m) ist die akkumulierte Ausfuhrungszeit, weiche der m'te Prozessor fur die Kommu- 
nikationsaufgaben verbraucht hat Tcp(avg) bedeutet eine mittlere angesammelte AusfQhrungszeit die fur 
Kommunikationsaufgaben verbraucht wurde. Twp(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Pro- 
zessor fur die Synchronisation verbraucht hat Twp(avg) bedeutet eine mittlere akkumulierte Ausfuhrungszeit 
die fur Synchronisationsaufgaben verbraucht wurde. Top(m) ist die akkumulierte Ausfuhrungszeit, die der m'te 
Prozessor fur Auf gaben verbraucht hat, die anders sind als die Koraraunikations- und Synchronisationsauf gaben, 
Top(avg) bedeutet eine mittlere akkumulierte Ausfuhrungszeit, die far andere Aufgaben verbraucht wurde. 
[SI 8b] Berechnen des Maximalwertes, Minimal wertes und der Standardabweichung a fur jede der akkuraulier- 
ten Ausfuhrungszeiten Tcp(ra), Twp(ra) und Top(m). 

[S18c] Berechnen der mittleren akkumulierten Ausfuhrungszeit des Anwenderprogramras gemaS der folgenden 
Gleichung: 



Tup(avg) = ^£ Tup(m) 

II 

« £]T (Tpp (m) -Tcp (m) -Twp (m) -Top (m) ) (4) 

IB=1 

worin Tpp(ra) die Ausfuhrungszeit bedeutet, die durch den m'ten Prozessor fur die in Betracht stehende 
Prozedur verbraucht wurde und wobei Tup(m) die Netto- Ausfuhrungszeit des Anwenderprogramras bedeutet 

Tup(m)~-Tpp(ra)-Tcp(m)-Twp{ra)-Top(m)) (5) 

[S18d] Berechnen des Maximalwertes, des Miniraalwertes und der Standardabweichung a fur die akkumulierte 
Ausfuhrungszeit des Anwenderprogramms Tup(m). 

[S18e] Berechnen der mittleren angesammehen Zeit von jeder parallel verarbeitenden Bibliotheksroutine, die in 
jeder Schleif e aufgeruf en wurde, geraaB den folgenden Gleichungen: 



. (6) 



... (7) 



. (8) 



Tcl(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Prozessor fur Kommunikationsaufgaben benOtigt hat 
Tcl(avg) bedeutet die mittlere angesammelte Ausfuhrungszeit, die fur Kommunikationsaufgaben verbraucht 
wurde. Twl(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Prozessor fur die Synchronisation bend tigt hat 
Twl(avg) bedeutet die mittlere akkumulierte Ausfuhrungszeit, die fur Synchronisationsaufgaben verbraucht 
wurde. Tol(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Prozessor fur Aufgaben verbraucht hat, anders 
als die Kommunikations- und Synchronisationsaufgaben. Tol(avg) bedeutet die mittlere akkumulierte Ausfuh- 
rungszeit, die fur andere Aufgaben verbraucht wurde. 

[S18f] Berechnen des Maximalwertes, des Miniraalwertes und der Standardabweichung a fur jede der akkumu- 
lierten Ausfuhrungszeiten Tclfra), Twl(m) und Tot(ni). 

[S18g] Berechnen der mittleren angesarnmeiten Ausfuhrungszeit des Anwenderprogramms gem&B der folgen- 
den Gleichung: 



Tul(ave) = 

- »Z (TP 1 (m) ~ Tcl (m) _Twl (m) " To1 (m) } * * * (9) 



Tel (avg) 
Twl (avg) 
Tol (avg) 



±2 Tcl(m) 
Twl(m) 
±£ Tol (in) 



worm Tpl(m) die Ausfuhrungszeit ist, die von dem m'ten Prozessor fur die in Betracht stehende Schleife 
verbraucht wurde und Tul(m) die akkumulierte Netto- Ausfuhrungszeit des Anwenderprogramms ist 

Tul(ra)~Tpl(m)-TcI(ni)-Twl(ra)-Tol(m)) (5) 

[S18h] Berechnen des Maxim alwertes r des Minimalwertes und der Standardabweichung o fflr die akkumulierte 
Ausfuhrungszeit des Anwenderprogramms Tul(ra). 

[S18i] Ausgeben der Ergebnisse der Schritte S18a bis S18h als eine rWd-Informationsdatei 16. 

Fig. 12 zeigt eine Tabelle, die die Informationen zusammenfaBt, weiche durch das LeistungsanaJysierersystera 
der vorliegenden Erfmdung gesammelt wurdea In dieser Tabelle 40 sind die gesammelten Informationen in io 
Einklang mit dem Subjekt der Profilierungsoperationen klassifiziert, weiche Prozeduren, Schleifen und parallel 
verarbeitende Bibliotheksroutinen enthalten, urn die Kornmunkation, Synchronisation und andere Aufgaben zu 
unterstQtzen. Obwohl in Fig, 12 nicht gezeigt, konnten bedingte Programraverzweigung auch in dem Profilsub- 
jekt enthalten sein. 

Ira aligemeinen werden Informationen, weiche das Prograramverhalten in jedera Prozessor betreff en, an drei is 
verschiedenen Stufen der Ausfuhrung gesamraelt: einer vorbereitenden Verarbeitungsstufe, einer Anlauf- Verar- 
beitungsstufe und einer Datenverarbeitungsstufe (terminal process staged 

Die vorbereitende Verarbeitungsstufe besteht aus einer Stufe, bevor eine bezeichnete Routine als Profilsub- 
jekt aufgerufen wird. Die drei Arten der Profil-Subjekte, die in der Tabelle 40 aufgelistet sind, erfordem es 
jedoch nicht, daB Informationen an der vorbereitenden Verarbeitungsstufe gesammelt werden. Wie oben 20 
dargelegt wurde, konnen auch bedingte Programraverzweigungen (in Fig. 7 nicht gezeigt) ein Ziel der Ausfuh- 
rungsprofilierung sein. Wenn dies der Fail ist, werden zusatzliche Bef ehle in den Quellencode eingefuhrt um eine 
andere Laufzeit-Subroutine aufzurufen, um Informationen an aktueDen Verzweigungsbedingungen zu sammela 
Spezieil enthalten solche Verzweigungsbedingungen "Wahr- oder Falsch-*Bedingungen als Ergebnis von iogi- 
schen Operationen oder "negative, Null- oder positive" Bedingungen als ein Ergebnis von arithraetischen 25 
Operationen, die vor den Verzweigungsbefehlen ausgefOhrt wurdea Die Laufzeit-Subroutine zihlt das Auftre- 
ten von jeder solcher Bedingungen, bevor eine Verzweigung durchgef uhrt wird, namlich bei der vorbereitenden 
Verarbeitungsstufe: 

Die Anlauf- Verarbeitungsstufe besteht aus einer Stufe, bei der eine Routine, die bei einem Profil-Subjekt 
beteiligt ist, zu laufen beginnt Spezieller gesagt wird die Ausfuhrungsstartzeit an der Anlauf- Verarbeitungsstufe 30 
von jeder Prozedur (siehe S12a in Fig. 5), Schleife (siehe S14a in Fig. 7) oder parallel verarbeitenden Bibliotheks- 
routine (siehe S16a in Fig. 9) aufgezeichnet Ira Falle der Schleifen wird der Anfangswert einer Schleifenzahler- 
Variablen und einer SchletfenzahJer-SchrittgroBe zusatzlich zu der Ausfuhrungsstartzeit (siebe S14b in Fig. 7) 
aufgezeichnet 

Die Datenverarbeitungsstufe oder Ende-Verarbeitungsstufe besteht aus einer Stufe, bei der eine Routine 35 
dabei ist zu enden. Bei der Ende-Verarbeitungsstufe jeder Prozedur werden die Ausfuhrungszeit der Prozedur 
und die Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die innerhalb der Prozedur 
aufgerufen wurde, akkumuliert (siehe S13b und S13c in Fig, 6\ wodurch die akkumulierten Ausfuhrungszeiten 
Tpp(raX Tcp(m), Twp(m) und Top(ra) erhaiten werden. In ahnlicher Weise werden bei der Ende-Verarbeitungs- 
stufe einer Schleife die Ausfuhrungszeit der Schleife und die Ausfuhrungszeit jeder parallel verarbeitenden 40 
Bibliotheksroutine, die innerhalb der Schleife aufgerufen wurde, akkumuliert (siehe S15b und S15e in Fig. 8)1 
wodurch die akkumulierten AusfQhrungszeiten TpI(mX Tcl(m), Twl(m) und ToI(m) fur die Schleife erhaiten 
werden. Zusatzlich wird bei der Ende-Verarbeitungsstufe von jeder Schleife die Zahl der Iterattonen ebenso 
akkumuliert In bezug auf die parallel verarbeitenden Bibliotheksroutinen wird die Ausfuhrungszeit von jeder 
Routine bei der Ende-Verarbeitungsstufe (siehe S 1 7b in Fig. 1 0) akkumuliert 45 

Die bei den oben beschriebenen drei ProzeBstufen gesammelten Informationen werden am Ende des Pro- 
gramms summiert und werden dann als eine Profil-Informationsdatei 16 ausgegeben. Zura Wiederaurfinden der 
summierten Informationen aus der Profil-Informationsdatei 16 bietet der Profilanzeigeprozessor 17 Ausfuh- 
rungsprofilsummen dera Anwender dieses Systems an. Um den Anwender rait einer verstandlichen und inforraa- 
tiven Anzeige zu versehen, verwendet der Profilanzeigeprozessor 17 verschiedene Darstellungsverf ahren, die tm 50 
folgenden beschrieben werden. 

Fig. 13 zeigt ein Diagramm, welches ein erstes Beispiel der aus Ausfuhrungsprofilanzeige nach der vorliegen- 
den Erfindung veranschaulicht In diesera Fall bildet die Prozedur # 1 den HauptkSrper des unter Test stehen- 
den parallel verarbeitenden Programms und es werden die Balkengraphiken fur die anderen Prozeduren und 
Schleifen hinsichdich der Ausfuhrungszeit der Prozedur # 1 skaliert (das heiBt die Ausfuhrungszeit des gesara- 55 
ten Programms). 

Die Ausfuhrungsprofilanzeige, die in Fig. 13 veranschaulicht ist, enthaJt Informationen hinsichtlich der Proze- 
duren # 1, # 2 usw. und hinsichtlich der Schleifen # 1, #2 usw. Jede Balkengraphik ist in vier Teile eingeteilt: die 
A^wenderprogramm-Ausfuhrungszeit Tu, die Kommunikationsaufgabe- Ausfuhrungszeit Tc, die Synchronisa- 
tionsaufgabe-Ausfuhrungszeit Tw und eine andere Aufgaben-Ausfuhrungszeit To. Die Aufteilung wird durch 60 
den Profilanzeigeprozessor 17 vorgenommen, und zwar im Einklang mit Mittelwerten der angesammelten 
Ausfuhrungszeiten. 

Ferner werden die Ergebnisse der statistischen Analyse fur jede Ausfuhrungszeitkategorie auf den Balkengra- 
phiken uberlagert, wo die minimalen Werte mit einem Sternchenzeichen w wiedergegeben sind, die maximalen 
Werte mit einem Symbol V wiedergegeben sind und die Standardabweichungen mit einem horizontalen 65 
Liniensegment wiedergegeben sind, welches zwischen diesen gezeichnet ist 

Eine solche gerade Aus- Anzeige der AusfOhrungsstatistiken erlaubt es dem Anwender, in einfacher Weise die 
Beziehung zwischen dem Anwenderprogramm und parallel verarbeitenden Zusatzen, inklusive Kommunika- 
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tions- und Synchronisationsaufgaben zu unterscheiden. Daruber hinaus kann der Anwendcr durch das Vorsehen 
der Maximum-, Minimum- und Standardabweichungssymbole auf eincn Blick erkennen, in welcher Weise die 
Prozentsatze aktuell schwanken. Dieses Merkmal hilft dem Anwender sehr, das Verhalten der Prozeduren und 
Schleifen zu verstehen, die in einera paraJlel verarbeitenden Programra enthahen sind, so daB dieser die 
Moglichkeit erhalt, zu beobachten, ob das Programra richtig arbeitet oder nicht und die Entscheidung treffen 
kann, ob weitere Programm-Modifikationen erforderlich sind oder nicht, um eine Qualitatsverbesserung zu 
erreichen, 

Fig. 14 zeigt ein Diagramm, welches ein zweites Beispiel der Ausfuhrungsprofilanzeige wiedergibt Im Gegen- 
satz zu dem ersten in Fig. 13 gezeigten Beispiel werden bei dem Verfahren nach dem zweiten Beispiel alle 
Prozeduren und Schleifen in den individuellen ZeitmaBstaben sichtbar gemacht, ungeachtet von deren absoluten 
Ausfuhrungszeiten. Das heiBt, die Langen der Balkengraphiken sind nicht proportional zu deren jeweiligen 
AusfuhrungszeidangeiL Die Graphiken in Fig. 14 erlauben es jedoch, daB der Anwender auf einfache Weise die 
Prozentsatze der Programmkomponenten verstehen kann (das heiBt Anwenderprogramm Tu, Koramunika- 
tionsaufgabe Tc Synchronisationsaufgabe Tw und andere Aufgaben To), die in jeder Prozedur oder Schleife 
involviert sind. 

Fig, 15 zeigt ein drittes Beispiel einer Ausfuhrungsprofilanzeige, bei der zwei Prozeduren # 1 und #2 in Form 
einer Kreisgraphik wiedergegeben sind. Kreisgraphiken erlauben im allgemeinen, daB der Anwender die Bezie- 
hung von Komponenten zu einer Gesamtheit einfacher vergleichen kann. Bei diesem dritten Anzeigeverf ahren 
zeigt ein gesamter Kxeis von 360 Grad die gesamte akkumulierte Ausfuhrungszeit einer Prozedur oder Schleife 
und vier Sektoren zeigen die Prozentsatze der Anwendeiprogramm-Ausfuiinmgszeit CTu), der Kommunika- 
tionsaufgabe-Ausf uhrungszeit (Tc), der Synchronisationsaufgabe- AusfOhrungszeit (Tw) und der anderen Auf ga- 
be- Ausfuhrungszeit (To) aa 

Fig. 16 zeigt ein viertes Beispiel einer Ausfuhrungsprofilanzeige, bei der das Ausfiihrungsprofil in Form einer 
Radarkarte wiedergegeben ist Die Radarkarte in Fig. 16 besitzt vier Achsen entsprechend den vier Programm- 
komponenten. Die akkumulierten Ausfuhrungszeitwerte (Tu, Tc, Tw und To) der Programmkomponenten sind 
auf deren jeweiligen Achsen aufgetragen und die aufgetragenen Punkte sind miteinander verbunden, um ein 
Polygon zu bilden, Aus der Gestalt dieses Polygons kann der Anwender intuitiv die Eigenschaften der Prozedur 
oder Schleife verstehen, die in einer Radarkarte proffliert sind 

Ahnlich den anderen Anzeigeverfahren, die soweit beschrieben wurden, umfaBt die Radarkarte, die in Fig. 16 
veranschaulicht ist, Infonnationen hinsichtlich der Minimal- und Maximalwerte und der Standardabweichung 
der akkumulierten Ausfuhrungszeit Dieses Merkmal ermoglicht es dem Anwender, das Verhalten jeder Pro- 
gramrakomponente in einem detailliert eren Wert zu verstehen. 

Fig. 17 zeigt ein funftes Beispiel einer Ausfuhrungsprofilanzeige gemaB der vorliegenden Erftndung. Ein 
Ausfuhrungsprofilfenster 50 besteht aus vier Abschnitten 50a bis 50d Der erste Abschnitt 50a enthalt die 
Legende der Balkengraphiken, die in den anderen Abschnitten des Fensters 50 dargestellt sind. Spezieller gesagt, 
definiert die Legende die Farbklassifiziening fur vier verschiedene Programmkomponenten, die bezeichnet sind 
mit: 

Anwender: Anwenderprogramm. 
Com: Kommunikationsaufgabe- Routine. 
Sync: Synchronisationsaufgabe-Routine. 
Runiib und Gop: andere Routinen. 

Das Ausfuhrungsprofilfenster 50 bei dem funften Beispiel verwendet diese Farbklassifizierung zusammen rait 
dem Darstellungsverf ahren wie in Fig. 13. 

Der zweite Abschnitt 50b des Ausfuhrungsprofilfensters 50 zeigt ein prozedur-gestfitztes Ausfuhrungsprofil, 
welches die akkumulierten Aushlhrungszeiten von mehreren Prozeduren, wie beispielsweise "MAIN*, "calcl", 
n calc2", *cputira w und InitaL", auf summiert 

Der dritte Abschnitt 50c des Ausfuhrungsprofilfensters 50 zeigt ein fang-gestutztes (caller-based) Ausfuh- 
rungsprofil, welches die akkumulierte Ausfuhrungszeit von jeder Prozedur zusammen mh dem Namen von 
dessen Fang-Routine (caller routine) zusammenfaBt Beispielsweise liest sich die oberste Zeile dieses Abschnitts 
wiefolgt: 

calcl < 10,292s > MAIN < UNSPECIFIED 

worin das links bezeichnete "calcl" der Name der Prozedur ist die durch erne Fang-Routine "MAIN" gerufen 
wurde. Das am weitesten rechts gelegene Zeichen" < UNSPECIFIED" bedeutet, daB die Fang-Routine nicht 
ihren eigenen Programmnamen deklariert und der inharente Name "MAIN" durch das Analysierersystem 
verwendet wird. Die Zeile zeigt auch an, daB die akkumulierte Ausfuhrungszeit dieser Prozedur "calcl" gleich 
1032 Sekunden betragt 

Die Balkengraphik fur diese "calcr-Prozedur ist farb-klassifiziert gemaB der Legende, die in dem ersten 
Abschnitt 50a definiert ist, wobei vier Teile der Balkengraphik jeweils die akkumulierten Ausfuhrungszeiten Tu, 
Tc, Tw und To zeigt, und zwar zusammen mit der Anzeige des Minimums, Maximums und der Standardabwei- 
chung. 

Der vierte Abschnitt 50d des Ausfuhrungsprofilfensters 50 zeigt ein rufer-gestiitztes Ausfuhrungsprofil. 
Beispielsweise liest sich die oberste Zeile des Abschnitts 50d wie folgt: 

MAIN < UNSPECIFIED inital 

worin die Angabe "MAIN < UNSPECIFIED" den Namen einer Rufer-Routine zeigt und die andere Aufschrift 
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"initaT den Naraen einer gerufenen Prozedur anzeigt Die Balkengraphik fOr diese InitaP-Prozedur ist farb-klas- 
sif iziert gemaB der in dera ersten Abschnitt 50a definierten Legende. Sie besteht aus vier Teilen, die jeweils die 
akkumulierten Ausfuhrungszeiten Tu, Tc, Tw und To als auch deren Minimum- und Maximumwerte und 
Standardabweichung mit den zuvor erwahnten Symbolen zeigen. 

Fig. 18 zeigte ein sechstes Beispiel der Ausfuhrungsprofildarstellung gemaB der voriiegenden Erfindung. Ein 5 
Ausfuhrungsprofilfenster 60 besteht aus vier Abschnitten 60a bis 60d Der erste Abschnitt 60a liefert die 
Legende von Balkengraphiken, die in den anderen Abschnitten des Fensters 60 dargestellt werden und spezieller 
definiert ist die Farbklassifikation fflr vier Progrararakomponenten, die bezeichnet sind mit: 
Anwender: Anwenderprogramm. 

Com: Kommunikationsaufgabe-Routine. 10 
Sync: Synchronisations auf gabe-Rourine. 
Runlib und Gop: andere Routinen. 

Die Legende umfaBt auch die Farbklassifizierung fur Verzweigungsbedingungen, die enthalt "Wahr"- und 
Talsch'-Bedingungen f&r logische Operationen und "negative", "Null-* und "positive" Bedingungen f&r arithmetic 
sche Operationen. 15 

Der zweite Abschnitt 60b des Ausfuhrungsprofilfensters 60 zeigt ein Ausfuhrungsprofil, welches die akkumu- 
lierten Ausfuhrungszeiten fQr mehrere SchJeifen zusammenfaBt 

Der dritte Abschnitt 60c des Ausfuhrungsprofilfensters 50 zeigt ein Ausfuhrungsprofil, welches die Verzwei- 
gungsbedingungen zusamroenfaBt Die obere Balkengraphik in dem dritten Abschnitt 60c veranschaulicht die 
Prozentsatze von "Wahr"- Bedingungen und "Falsch"-Bedingungen, die tatsachiich als ein Ergebnis der logischen 20 
Operationen aufgetreten sind Die hintere Balkengraphik veranschaulicht die Prozentsatze von "positiven", 
"Null-" und "negativen" Bedingungen, die tatsachiich als ein Ergebnis der arithmetischen Operationen aufgetre- 
ten sind 

Der vierte Abschnitt 16d des Ausfuhrungsprofilfensters 60 liefert ein gerufenen-gestiitztes (caller-based) 
Ausfuhrungsprofil, welches das gleiche ist wie bei dem dritten Abschnitt 50c in Fig. 17. 25 

Zusammenfassend fur die Fig* 12 bis 17 gibt die vorliegende Ausfuhrungsform die Ergebnisse der Leistungs- 
analyse wieder, und zwar unter Verwendung einer Vielfalt von Darstellungsverfahrea Neben der Moglichkeit, 
die mittlere Ausfuhrungszeit von jeder Subjekt- Routine darstellen zu konnen, zeigt das vorliegende Analysierer- 
systera die Maximum-, Minimum- und Standardabweichung der Ausfuhrungszeiten, wodurch der Anwender die 
Mdglichkeit erh&lt, mit einem Blick zu erkennen, wie die Prozentsatze tatsachlich schwanken. 30 

Bei der voriiegenden Ausfuhrungsform analysiert das Leistungsanalysierersystem das Parallelrechnersystem 
1 1 (siehe Fig. 1), welches aus vielf achen Prozessoren # 1 bis # n besteht Jedoch kann die vorliegende Erfindung 
auch auf ein einzelnes Prozessorsystem angewandt werden, welches vielfache Aufgaben ausfuhrt, und zwar 
durch Verwendung eines Zeitteilungsverfahrens. In diesem Fall sammeln mehrere geeignete Laufzeit-Subrouu- 
nen Ausfuhrungsdaten fur einzelne Prozesse oder Module, welche virtuell parallel laufen und das Leistungsana- 2$ 
lysierersystem summiert die gesararaelten Daten auf und steUt die Ergebnisse als AusfGhrungsprofile dar. Wie 
bei der voriiegenden Ausfuhrungsform zeigt das Ausfuhrungsprofil, welches auf einem Bildschirm dargestellt 
wird mittlere, Minimum- und Maximum -Ausfuhrungszeiten und die Standardabweichung von dem Mine I we rt 
hinsichtlich der Subjektprozesse oder Module, 

Die vorangegangene Beschreibung dient lediglich der Veranschaulichung der Prinzipien der voriiegenden 40 
Erfindung. Da ferner vielf altige Modifikationen und Anderungen fQr den Fachmann offensichtlich sind, ist nicht 
beabsichtigt die Erfindung auf die exakte Konstruktion und Anwendungen zu beschranken, die beschrieben 
wurden, und demzufolge fallen alle geeigneten Modifikationen und aquivaienten Ausfuhrungen in den Rahmen 
der Erfindung gemaB den anhangenden AnsprOcben und deren Aquivalente. 

Patentanspruche 

1. Verfahren zur sichtbaren Darstellung von Ergebnissen einer Leistungsftberwachung und -analyse fur ein 
Parallelrechnersystem, bei dem eine Vielzahl von Prozessoren ein parallel verarbeitendes Programm aus- 
fuhren, welches aus einer Vielzahl von Routinen zusammengesetzt ist wobei das Verfahren die folgenden 50 
Schritte umfaBt: 

(a) Sammeln von Informationen hinsichtlich der Ausfuhrungszeit von jeder Routine, die gleichiaufend 
durch eine Vielzahl von Prozessoren ausgefuhrt wird, unter Berucksichtigung der Klassifizierung der 
Routinen; 

(b) Ableiten eines Maximalwertes, eines Mittelwertes, eines Minimalwertes und einer Standardabwei- 55 
chung der Ausfuhrungszeit von jeder Routine basierend auf den Informationen, die fur die Vielzahl der 
Prozessoren gesammelt wurden; und 

(c) graphisches Darstellen der Ausfuhrungsprofil-lnforraarion, welche den Maximalwert, den Mittel- 
wert und den Minimal wert und die Standardabweichung der Ausfuhrungszeit jeder Routine enthalt 

2. Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die Ausfuhrungszeit von jeder Routine akkumu- so 
liert wird, jedesmal, wenn die Routine aufgerufen und ausgefuhrt wird 

3. Verfahren nach Anspruch t, bei dem bei dem Schritt (a) die Ausfuhrungszeit von jeder Routine gesam- 
melt wird, die als ein Subjekt der Profilierung bezeichnet wurde. 

4. Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die Routinen in ein Anwenderprogramm. 
Kommunikationsaufgaben, Synchronisationsaufgaben und andere Aufgaben klassifiziert werden. €5 

5. Verfahren nach Anspruch 3, bei dem das Subjekt der Profilierung Prozeduren, Schleifen und parallel 
verarbeitende Bibliotheksroutinen enthalt 

6. Verfahren nach Anspruch I, bei dem bei dem Schritt (b) ferner die Standardabweichung der AusfQhrungs- 
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zeit von jeder Routine zusatzlich zu dera Maximalwert, dem Mittelwert und dem Minimalwert berechnet 
wird 

7. Verfahren nach Anspruch 1, bei dera bei dem Schritt (c) Rufcr-Routincn und/oder Gerufener-Routinen 
aus den Routinen in dem parallel verarbeitenden Programm extrahiert werden und die AusfQhrungsprofil- 
information, welche zu den extrahierten Routinen gehdrt, dargestellt wird 

8. Verfahren nach Anspruch I, bei dem bei dem Schritt (c) eine Balkengraphik verwendet wird, urn graphiscb 
die Ausfuhrungsproftlinformation von jeder Routine darzustellen. 

9. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) eine Kreisgraphik verwendet wird, ura graphisch 
die Ausf uhrungsprofilmforraation von jeder Routine darzustellen. 

10. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) eine Radarkarte verwendet wird, um die 
Ausf uhrungsprofilinformation von jeder Routine graphisch darzustellen. 

1 1. Verfahren nach Anspruch 1, welches ferner die folgenden Schritte umfafit: 

(d) Annehmen einer Bezeichnung eines Punktes der Ausfuhnmgsprorllinformation, die bei dem Schritt 
(c) dargestellt wird, und 

(e) Darstellen eines Teiles des Queliencodes des parallel verarbeitenden Programme welches dem 
bezeichneten Punkt der Ausfuhnmgsprofilinforraadon entspricht 

11 Ein coraputer-lesbares Medium, welches mit einera Computer-Prograram codiert ist, bei dem das 
Verfahren nach Anspruch 1 implementiert ist 



Hierzu 18 Seite(n) Zeichnungen 
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